ارائه یک رتبه بند برای خطایاب معنایی با استفاده از ویژگی های حساس به متن

نویسندگان

بهزاد میرزابابایی

behzad mirzababaei university of tehranدانشگاه تهران هشام فیلی

heshaam faili university of tehranدانشگاه تهران

چکیده

در عصر فناوری، روزانه حجم زیادی از سند­های الکترونیکی تولید می­شود. از آنجا که این سند­ها توسط افراد مختلف تولید می­شود دارای خطاهایی هستند. وجود خطاها باعث کاهش کیفیت سند­ها می­شود، بنابراین وجود ابزارهای خطایاب باعث افزایش کیفیت می­شود. یکی از انواع خطاها، خطای معنایی حساس به متن است. همانطور که از نام این آن برمی­آید، برای تشخیص و تصحیح آن، نیاز به تحلیل اطلاعات موجود در متن است. در این مقاله، یک رتبه­بند متمایزگر مستقل از زبان برای خطایاب­های معنایی حساس به متن ارائه دادیم و از اطلاعات کل متن برای رتبه­بندی استفاده کردیم. این رتبه­بندی توسط ویژگی­های حساس به متن و یک مدل لگاریتم خطی انجام شده است. برای ارزیابی روش، از دو روش مبنای مختلف که یکی بر اساس مترجم ماشینی آماری و دیگری بر اساس مدل زبانی است استفاده کرده­ایم. به منظور ارزیابی سیستم از دو داده­ی آزمون مختلف در زبان فارسی استفاده شده است. این روش باعث بهبود 17% در بازخوانی تشخیص و تصحیح نسبت به روش مبنای مترجم ماشینی آماری شده است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه یک رتبه‌بند برای خطایاب معنایی با استفاده از ویژگی‌های حساس به متن

Nowadays, a large volume of documents is generated daily. These documents generated by different persons, thus, the documents contain spelling errors. These spelling errors cause quality of the documents are decrease. Therefore, existence of automatic writing assistance tools such as spell checker/corrector can help to improve their quality. Context-sensitive are misspelled words that have been...

متن کامل

ارائه رویکردی برای مدیریت و سازمان‌دهی اسناد متنی با استفاده از تجزیه‌وتحلیل هوشمند متن

Regarding the fact that stored data occupies a large space in organizations and retention systems and information management that has been resulted in gigantic data warehouses, the need for extracting an appropriate model is felt increasingly. Text mining is one of the most significant methods for extracting a useful and appropriate model that helps organizations in achieving their goals throug...

متن کامل

ارائه یک الگوریتم بهبود یافته وب کاوی برای وب معنایی

این مقاله در حوزه داده کاوی و وب معنایی بوده و در آن روشی برای شخصی سازی صفحات وب براساس اصول داده کاوی و وب معنایی ارائه شده است. روش پیشنهادی، از لاگ مشاهده صفحات توسط کاربران به عنوان خوراک بخش داده کاوی، و از محتوای صفحات به عنوان ورودی واحد پردازش معنا استفاده می کند. نتایج حاصل از این دو فرآیند، با یکدیگر ترکیب شده و به عنوان صفحات پیشنهادی مدنظر کاربر، به او ارائه می شود. ایده استفاده از...

متن کامل

بازسازی معنایی رساله برای دانشجویان دوره دکتری با نگاهی آسیب‌شناسانه و ارائه یک نظریه زمینه‌ای

هدف پژوهش حاضر، بازسازی نهایی رساله برای دانشجویان دوره دکتری با نگاهی آسیب‌شناسانه و ارائه یک نظریه زمینه‌ای است. پژوهش از نوع کیفی و از روش مردم‌نگاری استفاده شده است. جامعه آماری تحقیق شامل دانشجویان دوره دکتری دانشکده روان‌شناسی و علوم تربیتی دانشگاه علامه طباطبایی می‌باشد و نمونه آماری با استفاده از روش نمونه‌گیری هدفمند، (تعداد 15 دانشجوی دوره دکتری که در مراحل مختلف تدوین رساله دکتری بود...

متن کامل

بخش بندی معنایی نظارتی ضعیف با استفاده همزمان از اطلاعات سطح شی و سطح متن

در این مقاله، روش جدیدی برای بخش­بندی معنایی تصاویر در حضور داده­های آموزشی نظارتی ضعیف ارائه می­گردد. هدف اصلی در بخش­بندی معنایی اختصاص برچسب به تمامی پیکسل­های تصویر است. در داده­های آموزشی نظارتی ضعیف، تنها برچسب­های معنایی موجود در تصویر مشخص می­گردد و مکان آن­ها در تصویر مشخص نمی­گردد. نوآوری روش پیشنهادی، استفاده همزمان از اطلاعات سطح شی و سطح متن در تعیین برچسب­های معنایی در تصویر می­با...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پردازش علائم و داده ها

جلد ۱۲، شماره ۳، صفحات ۳-۱۴

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023